ТЕОРИЯ ИГР
Сущность синтеза игровых задач управления
Игровые задачи управления предполагают участие в активном воздействии на объект управления двух сторон или игроков [х]: управляющей системы, определяющей состояние объекта s = z, обеспечивающее эффективное управление (максимальное значение целевой функции q(z, Я), и среды, формирующей воздействие Я, ухудшающее эффективность управления (минимизирующее целевую функцию q(z, Я). Подобные ситуации, когда игроки преследуют прямо противоположные интересы, называются конфликтными ситуациями.
При известном пространстве возможных решений управляющей системы, которое определяется множеством допустимых состояний объекта z, и известном пространстве допустимых воздействий среды Л можно определить пространство возможных решений игровой задачи как прямое произведение Z х Л. Элементы пространства решений Z х Л представляют собой точки вида (z, Я), z е Z, Я е Л, т.е. определяются решениями, принимаемыми как первым, так и вторым игроками. Ситуация будет оптимальной для управляющей системы, если выбрана точка (z*, Я*) с Z х Л, обеспечивающая максимальное значение целевой функции по z и минимальное по Я. Такая точка называется седловой и ее поиск осуществляется с использованием следующего критерия [9].
q(z*, Я*) = max min q(z, Л)
zeZ ЛеА
Методы решения игровых задач управления
В случае, когда задача предназначена для принятия одного (единственного) решения, то она сводится к задаче линейного программирования и результат отыскивается с помощью его методов [42].
Если же речь идет о многократно повторяемой ситуации, то используются численные методы, где игроки разыгрывают несколько партий и цена игры определяется средним выигрышем.
Если цели не совпадают, то математическая модель становится гораздо сложнее и получить четкие рекомендации по оптимальному действию сторон становится значительно труднее [9].
Похожие рефераты: